ECOLE D’ETE CIST 2022
Inventaire des données sur le Benin
1 Humanitarian Data Exchange
Le signe OCHA désigne le United Nation Office for the Coordination of Human Affairs dont la vocation est de fournir une aide dans les situations d’urgence. Sa mission qui est expliquée en détail sur son site web comporte de nombreux volets. Cette agence est organisée sur un plan régional et comporte notamment une délégation spécialisée dans les pays d’Afrique Centrale et de l’Ouest appelée OCHA-ROWCA qui couvre l’ensemble despays ciblés par l’école d’été du CIST.
Pour mener à bien ses actions l’OCHA-ROWCA a développé un grand nombre de bases de données qui sont mises à jour régulièrement avec un accès à première vue facile. Ces données sont accessiblesà travers la plateforme Humanitarian Data Exchange (HDX) qui semble avoir été mise au point par OCHA. Cette plateforme HDX ne comporte pas seulement des données mais aussi différents outils de visualisation ou d’analyse.
Cela pourrait donc constituer une source majeure de données pour l’école d’été CIST 2022-2023, mais il faut en faire un inventaire précis. L’objet de cette note est de procéder à quelques explorations préliminaires en prenant comme cible le Bénin.
Si nous effectuons une requête Benin sur le site de données HDX ce qui conduit à une liste de 25 sources de données provenant soit de OCHA-ROWCA, soit d’autres agences des Nations-Unies (FAO, WorldBank, WolrdPop, …). On trouve encore plus de sources (environ 200) si on utilise le menu de recherche par pays car le moteur ajoute dans ce cas des bases de données transnationales.
Le HDX est donc un véritable hub de concentration des données les plus récentes sur les pays qui nousintéressent pour l’école d’été, et pas seulement le Benin.
Comme on ne peut tout explorer d’un coup, nous commençons par les données qui viennet à proprement parler d’OCHA-ROWCA.
Nous procédons ci-dessous à l’inventaire des sources mises à jour pour le Benin sur HDX.
1.1 Limites administratives en 2019
Le dossier des limites administratives du Benin (cliquer ici) est accessible au format shapefile et comporte différentes couches correspondant aux différents niveaux administratifs. Sa datation laisse augurer qu’il s’agit de la situation la plus récente: les fichiers datent de juin 2021 mais leur nom comporte la séquence “20190816” qui doit plutôt correspondre au 16 Août 2019.
Départements et communes du Bénin (Source : OCHA-ROWCA)
Compte tenu des fortes différences de densité de population à l’intérieur du pays, il peut s’avérer intéressant de produire des cartogrammes où la surface est déformée par la population. On peut ainsi produire à l’aide du petit logiciel Scapetoad une vision un peu différente du pays où le poids démographique du sud est mis en valeur.
Cartogramme du Benin selon la population en 2019 (Source : OCHA-ROWCA)
1.2 Villages et localités vers 2015
Un autre dossier accessible en cliquant ici concerne le peuplement, c’est-à-dire l’inventaire de toutes les localisations avec leur nom et leur position en latitude longitude. Il comporte 6306 entrées. Les fichiers sont datés de 2015.
Village et peuplement au Benin vers 2015 (Source : OCHA-ROWCA)
A titre de vérification de la précision, nous effectuons une superposition sur le fonds de carte OpenStreetMap pour la commune de Ouidah (code BJ0304 ou BEN003004) ou aura lieu l’école d’été du CIST. En cliquant sur les points onpeut comparer leur nom avec celui des localités indiquées par OSM.
Projection des données OCHA-ROWCA sur Open Street Map (commune de Ouidah
Il y a à l’évidence des décalages … Et le contour de la commune lui-même ne semble pas coller exactement avec celui fourni par OSM. Il faudra vérifier laquelle des deux sources est erronée (à moins que ce ne soient les deux ?). Toutefois, la localisation semble rester approximativement juste …
1.3 Pyramide des âges 2019 (estim.)
Un dossier accessible ici fournit les populations par âge et par sexe en 2019 au niveau des communes, départements ou pays entier. Il s’agit naturellement d’estimations mais les données n’en sont pas moins très utile pour toute analyse travaillant sur les situations présentes. Les classes d’âges sont suffisamment détaillées (tranches de 5 ans de 0 à 80 ans) pour procéder à des analyses démographiques intéressantes. A titre d’exemple, on réalise une AFC sur la pyramide des âges des 77 communes
AFC sur les structures par âge et sexe des communes du Benin en 2019 (Source : OCHA-ROWCA)
On enchaîne par une CAH (sur les axes de l’AFC) :
Type de structures par âge et sexe des communes du Benin en 2019 (source : OCHA)
Position des classes de la CAH sur les axes de l’AFC (source : OCHA)
Il reste à visualiser les classes. On crée pour cela une fonction assez complexe de comparaison entre le profil de celles-ci et le profil du Bénin, inspirée d’un programme trouvé sur un forum du CIRAD
Profils moyens des classes (source : OCHA)
- la classe 1 : correspond à une population beaucoup plus jeune que la moyenne du pays avec un excédent de 0-9 ans et un déficit de 30 ans et plus. C’est la partie du pays où la transition démographique semble être la plus tardive
- la classe 2 : présente également un profil de population jeune avec un excédent de 5-14 ans, mais se caractérise par une réduction relative des 0-4 ans qui témoigne soit d’une baisse de la fécondité, soit d’un exode rural des jeunes ménages avec enfants.
- la classe 3 correspond au profil moyen du pays.
- la classe 4 est caractérisée par un excédent de personnes âgées et un déficit à la fois de jeunes enfants et de jeunes adultes. Elle correspond à des zones de vieillissment relatif de la population, soit sous l’effet de l’exode rural, soit en raison d’une baisse de la fécondité.
- la classe 5 est caractérise par une forte surreprésentation des jeunes adultes et des persones âgées, associée à un net déficit des enfants jeunes de 0 à 14 ans. Il s’agit vraisemblablement de zones urbaines caractérisées par une fécodité plus tardive et une meilleure espérance de vie.
On peut visualiser la distribution de ces cinq classes sur une carte :
Distribution spatiale des classes (source : OCHA)
1.4 Alphabetisation et langues parlées (2013)
1.4.1 Métadonnées
Ce fichier qui est accessible sur HDX en suivant ce lien a été mis à disposition par l’organisation Translators without borders mais l’analyse des métadonnées montre qu’il s’agit en fait de données extraites du recensement géénral de population du Bénin de 2013 :
Created by Translators without Borders, Uploaded on Jun-21, Version 1
Notes and caveats
- All data is drawn from government survey results and is subject to any associated limitations or distortions present in the source data.
- Literacy was measured as the ability to read and write in any language. Languages with population shares less than 0.01% or under 1,000 people (whichever is greater) have been aggregated into the “Other” field.
- All decimal values have been rounded to a maximum of 3 decimal places. As a result language shares may not total 100%.
- Empty values represent non-existent data and should not be treated as zero values. Data is available under an Attribution NonCommercial ShareAlike 4.0 International license (CC BY NC SA 4.0)
Copyright and terms of use
- You are free to share and adapt the data subject to requirements for attribution and non commercial use.
- Any derivative work must be distributed under the same license as the original. Full terms at https://creativecommons.org/licenses/by nc sa/4.0/
1.4.2 Préparation des données
Les fichiers fournies comportaient de petites erreurs ou des difficultés de formatage rendant compliquée leur importation dans R. Il a donc fallu les corriger un peu avant de les utiliser. Une fois cela effectué, on a vérifié que les données pouvaient se cartographie en effectuant une jointure avec le fichier administratif au niveau communal et en créant un fichier unique au format sf (spatial feature) pour les analyses ultérieures.
1.5 Prix de la nourriture sur les marchés (2002-2021)
1.5.1 Métadonnées
Ce fichier qui est accessible sur HDX en suivant ce lien a été mis à disposition par World Food Programme. Cette base qui semble avoir été interrompue présente l’avantage d’offrir une grande profondeur historique et une résolution spatialetrès précise puisque les prix sont localisés par marché et par semaine.
This no longer updated dataset contains Global Food Prices data from the World Food Programme covering foods such as maize, rice, beans, fish, and sugar for 76 countries and some 1,500 markets. It is updated weekly but contains to a large extent monthly data. The data goes back as far as 1992 for a few countries, although many countries started reporting from 2003 or thereafter.
1.5.2 Préparation des données
Le fichier contenant les coordonnées de latitude et de longitude des marchés, il peut théoriquement être cartographié facilement à l’aide d’un outil de cartographie dynamique tel que mapview. Mais il peut aussi faire l’objet de multiples agrégations spatiales, temporelles, par produit. Reste évidemment à en apprécier la qualité …
Noter qu’il est nécessaire d’éliminer la seconde ligne du tableau sous excel pour pouvoir ensuite charger correctement le fichier. Il est également préférable de lire le fichier avec la fonction fread() du package data.table faut de quoi on peut avoir des problèmes d’encodage plus ou moins délicats à résoudre.
| date | admin1 | admin2 | market | latitude | longitude | category | commodity | unit | priceflag | pricetype | currency | price | usdprice |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 2002-01-15 | Alibori | Malanville | Malanville (CBM) | 11.86 | 3.38 | cereals and tubers | Maize | KG | actual | Wholesale | XOF | 145.00 | 0.2503 |
| 2002-01-15 | Alibori | Malanville | Malanville (CBM) | 11.86 | 3.38 | cereals and tubers | Millet | KG | actual | Wholesale | XOF | 145.00 | 0.2503 |
| 2002-01-15 | Alibori | Malanville | Malanville (CBM) | 11.86 | 3.38 | cereals and tubers | Rice (imported) | KG | actual | Wholesale | XOF | 293.33 | 0.5064 |
| 2002-01-15 | Alibori | Malanville | Malanville (CBM) | 11.86 | 3.38 | cereals and tubers | Sorghum | KG | actual | Wholesale | XOF | 141.67 | 0.2446 |
| 2003-01-15 | Alibori | Malanville | Malanville (CBM) | 11.86 | 3.38 | cereals and tubers | Maize | KG | actual | Wholesale | XOF | 106.00 | 0.1830 |
| 2003-01-15 | Alibori | Malanville | Malanville (CBM) | 11.86 | 3.38 | cereals and tubers | Millet | KG | actual | Wholesale | XOF | 116.00 | 0.2002 |
On peut assez facilement spatialiser le fichier qui comporte en tout 51 marchés assez bien répartiis sur l’ensemble du pays comme le montre la carte ci-desous :
1.5.3 Intérêt pédagogique
Cette base de données multidimensionelle peut servir d’exemple pour de nombreux exercices d’apprentissage de la statistique et de la cartographie sous R. Le prix des produits alimnentaires dépend en effet :
- du type de produit (QUOI) ?
- de la date d’achat (QUAND) ?
- du lieu d’achat (OU ?)
Pour chacune des dimensions, on peut réaliser des procédures d’agrégation des valeurs observées ou d’estimation des valeurs manquantes. A titre d’exemple, on extrait de la base de donnée l’ensemble des lignes qui concernent le riz
| when | where1 | where2 | where3 | what | cost |
|---|---|---|---|---|---|
| 2002-01-15 | Alibori | Malanville | Malanville (CBM) | Rice (imported) | 0.5064 |
| 2003-01-15 | Alibori | Malanville | Malanville (CBM) | Rice (imported) | 0.4972 |
| 2003-02-15 | Alibori | Malanville | Malanville (CBM) | Rice (imported) | 0.5136 |
| 2003-03-15 | Alibori | Malanville | Malanville (CBM) | Rice (imported) | 0.4877 |
| 2003-04-15 | Alibori | Malanville | Malanville (CBM) | Rice (imported) | 0.4963 |
| 2003-05-15 | Alibori | Malanville | Malanville (CBM) | Rice (imported) | 0.5006 |
On peut calculer le prix median du riz sur l’ensemble des points de sondage disponibles en fonction de la catégorie de riz :
Le graphique montre plusieurs choses :
- les données les plus complètes concernent le riz importé qui augmente fortement au moment de la crise de 2007-2008
- la spatialisation des données n’est pas vraiment possible avant 2015 voire 2018
- il y a de fortes différences de prix selon le type de riz
Effectuons maintenant un zoom sur le priz médian du riz importé en 2020-2021 par régions :
Bibliographie
Annexes
Infos session
| setting | value |
|---|---|
| version | R version 4.0.2 (2020-06-22) |
| os | macOS Catalina 10.15.7 |
| system | x86_64, darwin17.0 |
| ui | X11 |
| language | (EN) |
| collate | fr_FR.UTF-8 |
| ctype | fr_FR.UTF-8 |
| tz | Europe/Paris |
| date | 2021-12-17 |
| package | ondiskversion | source |
|---|---|---|
| cowplot | 1.1.1 | CRAN (R 4.0.2) |
| data.table | 1.13.0 | CRAN (R 4.0.2) |
| dplyr | 1.0.2 | CRAN (R 4.0.2) |
| explor | 0.3.7 | CRAN (R 4.0.2) |
| FactoMineR | 2.4 | CRAN (R 4.0.2) |
| ggplot2 | 3.3.3 | CRAN (R 4.0.2) |
| knitr | 1.34 | CRAN (R 4.0.2) |
| leaflet | 2.0.3 | CRAN (R 4.0.2) |
| mapsf | 0.1.1 | CRAN (R 4.0.2) |
| mapview | 2.9.0 | CRAN (R 4.0.2) |
| rmarkdown | 2.11 | CRAN (R 4.0.2) |
| rzine | 0.1.0 | gitlab (rzine/package@a94bf55) |
| sf | 0.9.8 | CRAN (R 4.0.2) |
| tidyr | 1.1.2 | CRAN (R 4.0.2) |
Citation
@Manual{ficheRzine,
title = {Titre de la fiche},
author = {{Auteur.e.s}},
organization = {Rzine},
year = {202x},
url = {http://rzine.fr/},
}